Alinear estados ocultos verificados mejora razonamiento en RL
Hidden-Align alinea estados ocultos verificados para mejorar el razonamiento en RL, logrando hasta 6.2 puntos de mejora en benchmarks.
Hidden-Align alinea estados ocultos verificados para mejorar el razonamiento en RL, logrando hasta 6.2 puntos de mejora en benchmarks.
Hidden-Align alinea estados ocultos en modelos de lenguaje, mejorando el razonamiento matemático hasta un 6.2% en benchmarks. Técnica innovadora de RL.
Una sonda lineal en capas medias de LLMs cuantizados detecta alucinaciones con hasta un 100% de precisión, superando a métodos de muestreo.
¿Las sondas lineales detectan razonamiento o formato? Un estudio revela que la precisión en LLMs se explica por confusores de formato, no por modos de razonamie
Descubre CANARY, el primer método que detecta contaminación oculta en modelos de lenguaje con solo dos pases, incluso al 1% de envenenamiento. Protege tu IA.
Comparativa de memoria: Chain-of-Thought vs Transformers en bucle comprimido. Los bucles no pueden igualar el razonamiento con scratchpad. ¡Descubre por qué!